Сайт ДонНТУ Сайт магистров ДонНТУ
Українською in English Биография Обзор магистерской работы Библиотека Ссылки Результаты поиска Записки двух программистов |
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Для определения распространненности исследуемой темы, было проведено следующее исследование:
ряду популярных поисковых сайтов в Интернет был дан ряд запросов и зафиксировано количество найденных
сайтов по запросу сайтов.
Из таблицы видно, что русскоязычные запросы лучше всего обрабатываются поисковым сервером Rambler, а англоязычные - Google (разумеется, среди рассмотренных). Также можно увидеть, что англоязычный Интернет содержит на несколько порядков больше страниц, содержащих ключевые слова по теме. Следует отметить, что "страницы, содержащие ключевые слова по теме" еще не значит "страницы на тему", так как слово граф имеет не одно значение в русском языке, а слово graph - еще больше значений в английском (причем не только как имя существительное, но и как глагол). Это во многом применимо и к другим словам, использованным в запросах. Следовательно, большое число страниц, содержащих искомые ключевые слова, может свидетельствовать как о более обширном представлении темы, так и о большей засоренности информационного пространства. Проверить какое из этих утверждений правильное не представляется возможным, так как обработать даже краткое описание нескольких сотен тысяч страницы достаточно трудоемко. Но в силу того, что количество страниц-ответов на запросы с большим количеством ключевых слов или более специальные запросы оказалось в среднем на 2-3 порядка меньше, более вероятной кажется версия о засоренности. С другой стороны, графы представляют собой весьма распространенные структуру данных и математический аппарат, используемые во многих областях науки и техники. Но такая поразительная разница в числах вызывает некоторые сомнения в том, что это может быть причиной наблюдаемого явления. Вновь затрагивая тему сравнения поисковых сайтов, отметим, что количественные оценки результатов Rambler и Yandex колеблются относительно друг друга. Причем эти колебания не зависят ни от темы, ни от степени ее специализации. Единственный вывод, который можно сделать в данном случае: для повышения вероятности найти необходимую информацию следует параллельно использовать оба сайта. Meta-Ukraine является "молодым" сайтом, но уже может составить конкуренцию остальным рассматриваемым поисковым серверам, правда в ограниченном круге тем. Для рассмотрения изменения распространенности темы было проведено повторное исследование. Данные на 1.06.2004
При сравнении таблиц видно, что ситуация в англоязычной части таблицы в целом не изменилась: результаты некоторых стали больше, других - меньше, но большинство этих изменений несущественны, так как они не превышают 10%. Но некоторые темы все-таки набирают популярность, это генетические алгоритмы, нейросети и поиск табу. (за условный показатель популярности темы был принят максимум по запросу: по поисковым серверам). Эти темы действительно считаются приоритетными направлениями исследований и развиваются очень быстро. В русскоязычном Интернете можно отметить значительный рост популярности. Также сильно изменилось поведение сайтов: усилились позиции Rambler, и расширился англоязычный поиск Yandex. Результаты поиска Meta-Ukraine практически не отличаются. В заключение можно сказать, что при поиске в Интернете англоязычной информации по рассматриваемой теме следует использовать Google, и при поиске русскоязычной - Rambler. Yandex и Meta-Ukraine использовать нецелесообразно, несмотря на то, что Yandex в период между экспериментами провел переиндексацию ресурсов Интернет. Возможно, руководство Yandex, считает более приоритетными другие темы. |